DeepMind的游戏理论与多代理团队研究多学科学习的几个方面,从计算近似值到游戏理论中的基本概念,再到在富裕的空间环境中模拟社会困境,并在困难的团队协调任务中培训3-D类人动物。我们小组的一个签名目的是使用DeepMind在DeepMind中提供的资源和专业知识,以深入强化学习来探索复杂环境中的多代理系统,并使用这些基准来提高我们的理解。在这里,我们总结了我们团队的最新工作,并提出了一种分类法,我们认为这重点介绍了多代理研究中许多重要的开放挑战。
translated by 谷歌翻译
我们提出了一种使用绑架过程,在给定的答案集编程(ASP)规则集(ASP)规则集方面生成可能的查询证明,该过程仅根据输入规则自动构建了陈腐的空间。给定一组(可能是空的)用户提供的事实,我们的方法会渗透到需要查询的任何其他事实,然后输出这些额外的事实,而无需用户需要明确指定所有占有无误的空间。我们还提出了一种方法,以生成与查询的理由图相对应的一组定向边缘。此外,通过不同形式的隐式术语替换,我们的方法可以考虑用户提供的事实并适当修改绑架解决方案。过去的绑架工作主要基于目标定向方法。但是,这些方法可能导致并非真正声明的求解器。关于实现绑架的绑架者,例如Clingo ASP求解器,做出的工作要少得多。我们描述了可以直接在Clingo中运行的新型ASP程序,以产生绑架解决方案和定向边缘集,而无需修改基础求解引擎。
translated by 谷歌翻译